SegCV : Eficient parsing of résumés with analysis and correction of errors (SegCV : traitement efficace de CV avec analyse et correction d'erreurs) [in French]
نویسندگان
چکیده
RÉSUMÉ Le marché d’offres d’emploi et des candidatures sur Internet a connu, ces derniers temps, une croissance exponentielle. Ceci implique des volumes d’information (majoritairement sous la forme de textes libres) intraitables manuellement. Les CV sont dans des formats très divers : .pdf, .doc, .dvi, .ps, etc., ce qui peut provoquer des erreurs lors de la conversion en texte plein. Nous proposons SegCV, un système qui a pour but l’analyse automatique des CV des candidats. Dans cet article, nous présentons des algorithmes reposant sur une analyse de surface, afin de segmenter les CV de manière précise. Nous avons évalué la segmentation automatique selon des corpus de référence que nous avons constitués. Les expériences préliminaires réalisées sur une grande collection de CV en français avec correction du bruit montrent de bons résultats en précision, rappel et F-Score.
منابع مشابه
Modèle d'Evaluation des Systèmes et Ressources Applicables à la Correction d'Erreurs dans les Documents
RÉSUMÉ. L'adoption massive des services dits du Web 2.0 a entraîné une augmentation de la quantité d'informations produites. La quantité d'erreurs contenues dans ces informations a quant à elle évolué de façon plus importante. En effet, si dans un processus de production d'information classique les documents étaient issus de professionnels, dans le cadre du Web, ce sont principalement les utili...
متن کاملDétection et correction automatique d'erreurs d'annotation morpho-syntaxique du French TreeBank (Detecting and Correcting POS Annotation in the French TreeBank) [in French]
Detecting and correcting POS annotation in the French TreeBank The quality of the Part-Of-Speech (POS) annotation in a corpus has a large impact on training and evaluating POS taggers. In this paper, we present a series of experiments that we have conducted on automatically detecting and correcting annotation errors in the French TreeBank. Two methods are used. The first simply relies on identi...
متن کاملPlaying with parsers (Jouer avec des analyseurs syntaxiques) [in French]
Résumé. Nous présentons DYALOG-SR, un analyseur syntaxique statistique par dépendances développé dans le cadre de la tâche SPRML 2013 portant sur un jeu de 9 langues très différentes. L’analyseur DYALOG-SR implémente un algorithme d’analyse par transition (à la MALT), étendu par utilisation de faisceaux et de techniques de programmation dynamique. Une des particularité de DYALOG-SR provient de ...
متن کاملIncremental displacement-correction schemes for incompressible fluid-structure interaction
In this paper we introduce a class of incremental displacement-correction schemes for the explicit coupling of a thin-structure with an incompressible fluid. These methods enforce a specific Robin-Neumann explicit treatment of the interface coupling. We provide a general stability and convergence analysis that covers both the incremental and the non-incremental variants. Their stability propert...
متن کاملChronic Lymphedema and Its Treatment
L 'anatomie ct la pathologie du systeme lymphatique sont discutees a la lumieres des etudes lymphographiques. Ces etudes ont surtout demontre l'indeoendance relative des deux systemes lymphatiques superficiel et profond et lamplexite des anomalies que l'en rencontre a leur niveau. Les lymphoedeme primaires sont distangues. Les nouvelles tec'.111iques operatoires employees pour le traitement de...
متن کامل